脑小血管疾病的成像标记提供了有关脑部健康的宝贵信息,但是它们的手动评估既耗时又受到实质性内部和间际变异性的阻碍。自动化评级可能受益于生物医学研究以及临床评估,但是现有算法的诊断可靠性尚不清楚。在这里,我们介绍了\ textIt {血管病变检测和分割}(\ textit {v textit {where valdo?})挑战,该挑战是在国际医学图像计算和计算机辅助干预措施(MICCAI)的卫星事件中运行的挑战(MICCAI) 2021.这一挑战旨在促进大脑小血管疾病的小而稀疏成像标记的自动检测和分割方法的开发,即周围空间扩大(EPVS)(任务1),脑微粒(任务2)和预先塑造的鞋类血管起源(任务3),同时利用弱和嘈杂的标签。总体而言,有12个团队参与了针对一个或多个任务的解决方案的挑战(任务1 -EPVS 4,任务2 -Microbleeds的9个,任务3 -lacunes的6个)。多方数据都用于培训和评估。结果表明,整个团队和跨任务的性能都有很大的差异,对于任务1- EPV和任务2-微型微型且对任务3 -lacunes尚无实际的结果,其结果尤其有望。它还强调了可能阻止个人级别使用的情况的性能不一致,同时仍证明在人群层面上有用。
translated by 谷歌翻译
在本文中,我们介绍了人际内和人际关系网络(I^2R-NET),以进行多人姿势估计。它涉及两个基本模块。首先,人类内部关系模块在一个人身上运行,旨在捕获人类内部依赖性。其次,人际关系模块考虑了多个实例之间的关系,并着重于捕获人间的相互作用。人际关系间的关系模块可以通过减少特征图的分辨率来设计非常轻巧,但学习有用的关系信息以显着提高人类内部关系模块的性能。即使没有铃铛和哨子,我们的方法也可以竞争或胜过当前的比赛获胜者。我们对可可,人群和ochuman数据集进行了广泛的实验。结果表明,所提出的模型超过了所有最新方法。具体而言,所提出的方法在众群数据集上达到了77.4%的AP和Ochuman数据集上的67.8%AP,从而超过了现有方法的大幅度优于较大的利润率。此外,消融研究和可视化分析还证明了我们的模型的有效性。
translated by 谷歌翻译
在单光子激光雷达,光子效率成像捕捉所述3D场景的由每个像素只几个检测到的信号的光子结构。此任务的现有深度学习模型被训练在模拟数据集,当应用到现实的情景,这对域转移的挑战。在本文中,我们提出了一种时空以来网络(STIN)用于光子效率成像,这是能够通过充分利用空间和时间信息精确地预测从稀疏和高噪声光子计数直方图的深度。然后,域对抗性适应框架,包括域对抗性神经网络和对抗性判别域适应,被有效地应用于STIN缓解域移位问题对于实际应用。从NYU〜v2和所述数据集Middlebury的所产生的模拟数据综合实验证明STIN优于国家的最先进的模型在低信号 - 背景比为2:10至2:100。此外,在由该单光子成像原型显示,相比与域对抗性训练STIN取得了较好的推广性能捕捉到的真实世界的数据集实验结果的国家的最艺术以及由模拟数据训练基线STIN 。
translated by 谷歌翻译
单光子光检测和测距(LIDAR)已广泛应用于挑战性方案的3D成像。然而,在收集的数据中有限的信号光子计数和高噪声对预测深度图像精确地构成了巨大的挑战。在本文中,我们提出了一种用于从高噪声数据的光子有效成像的像素 - 方面的剩余收缩网络,其自适应地产生每个像素的最佳阈值,并通过软阈值处理来剥夺中间特征。此外,重新定义优化目标作为像素明智的分类,提供了与现有研究相比产生自信和准确的深度估计的急剧优势。在模拟和现实世界数据集中进行的综合实验表明,所提出的模型优于现有技术,并在不同的信噪比下保持鲁棒成像性能,包括1:100的极端情况。
translated by 谷歌翻译
表示标签分布作为一个热量矢量是培训节点分类模型中的常见做法。然而,单热表示可能无法充分反映不同类别中节点的语义特征,因为某些节点可以在其他类中的邻居语义上靠近其邻居。由于鼓励在对每个节点进行分类时,鼓励模型分配完全概率,因此会导致过度自信。虽然具有标签平滑的培训模型可以在某种程度上缓解此问题,但它仍然无法捕获图形结构隐含的节点的语义特征。在这项工作中,我们提出了一种新颖的SAL(\ Textit {Security-Aware标签平滑})方法作为流行节点分类模型的增强组件。 SAL利用图形结构来捕获连接节点之间的语义相关性并生成结构感知标签分配以替换原始的单热标签向量,从而改善节点分类性能而不推广成本。七节点分类基准数据集的广泛实验揭示了我们对改进转膜和归纳节点分类的含量的有效性。经验结果表明,SALS优于标签平滑方法,增强节点分类模型以优于基线方法。
translated by 谷歌翻译
在本文中,我们提出了一种确定性变分推理方法,通过最小化内核差异来产生低差异点,也称为最大均值差异或MMD。基于Wang Et的一般能量变分推理框架。 al。 (2021),最小化内核差异被转换为通过显式欧拉方案求解动态颂音系统。我们将结果算法EVI-MMD命名,并通过其中统一化常数的常规规定常量规定的实例,并以培训数据的形式明确地已知的示例。与分布近似,数值集成和生成式学习中的应用中的替代方法相比,其性能令人满意。 EVI-MMD算法克服了现有MMD-DESCLITHMS的瓶颈,主要适用于两个样本问题。可以在EVI框架下开发具有更复杂结构和潜在优势的算法。
translated by 谷歌翻译
量子多体系统的状态是在高维的希尔伯特空间中定义的,可以对子系统之间的丰富而复杂的相互作用进行建模。在机器学习中,复杂的多个多线性相关性也可能存在于输入功能中。在本文中,我们提出了一个量子启发的多线性模型,称为残留张量列(RESTT),以捕获单个模型中从低阶到高阶的特征的多次多线性相关性。 RESTT能够在高维空间中建立强大的决策边界,以解决拟合和分类任务。特别是,我们证明了完全连接的层和Volterra系列可以将其视为特殊情况。此外,我们得出了根据平均场分析来稳定RESTT训练的权重初始化规则。我们证明,这样的规则比TT的规则放松得多,这意味着休息可以轻松解决现有TT模型中存在的消失和爆炸梯度问题。数值实验表明,RESTT的表现优于最先进的张量网络,并在MNIST和时尚MNIST数据集上进行基准深度学习模型。此外,RESTT在两个实践示例上的统计方法比其他有限数据的统计方法更好,这些方法具有复杂的功能相互作用。
translated by 谷歌翻译
学习多模式表示涉及从多个异构数据来源集成信息。这是一个充满挑战的重要领域,具有多媒体,情感计算,机器人,金融,人机互动和医疗保健的众多现实世界应用。不幸的是,多式化研究已经有限的资源研究(1)跨领域的概括和方式,(2)在训练和推理期间的复杂性,(3)嘈杂和缺少方式的鲁棒性。为了加速进展到深入的方式和任务,同时确保实现现实世界的稳健性,我们释放多麂,系统和统一的大规模基准,跨越15个数据集,10个模态,20个预测任务和6个研究领域。 Multibench提供自动端到端的机器学习管道,简化和标准化数据加载,实验设置和模型评估。为了使整体评价能够进行全博,提供综合方法,以评估(1)泛化,(2)时间和空间复杂度,以及(3)模型鲁棒性。 Multibench对未来的研究引入了积极的挑战,包括对大规模多模式数据集的可扩展性以及对现实缺陷的鲁棒性。要伴随该基准,我们还提供了多式化学习中的20个核心方法的标准化实现。简单地应用于不同研究领域提出的方法可以提高9/15数据集的最先进的性能。因此,Multibench介绍了一个里程碑,以统一多模式研究中的抗议努力,并铺平了更好地了解多式式模型的能力和限制,所有的易于使用,可访问性和再现性。将公开可用的多班,我们的标准化代码和排行榜将经常更新,并欢迎来自社区的投入。
translated by 谷歌翻译
诸如纠缠和连贯性的量子属性是各种量子信息处理任务中的不可或缺的资源。然而,仍然缺乏有效和可扩展的方法来检测这些有用的特征,特别是对于高维和多分钟量子系统。在这项工作中,我们利用样品的凸性,没有所需的量子特征,并设计无监督的机器学习方法,以检测异常等特征的存在。特别是,在纠缠检测的背景下,我们提出了一种由伪暹罗网络和生成的对抗网组成的复合性神经网络,然后仅使用可分离状态培训,以构建非线性证人来纠缠的纠缠。通过数值示例显示,从两种时序到十个QUB比特系统,我们的网络能够实现高于97.5%的高检测精度.ORORE,它能够揭示富有的缠结结构,例如子系统中的部分纠缠。我们的结果是随时适用于检测其他量子资源,如Bell Nonelocity和Steravency,因此我们的工作可以提供强大的工具,以提取隐藏在多分钟量子数据中的量子特征。
translated by 谷歌翻译
Quantum语言模型(QLMS),其中单词被建模为SEQUEMES的量子叠加,已经证明了高水平的模型透明度和良好的性能解释性。然而,在当前的文献字序列中,基本上模拟为单词状态的经典混合物,这不能完全利用量子概率描述的潜力。尚未开发完整量子模型以明确地捕获单词序列内的非古典相关性。我们提出了一种具有新颖纠缠嵌入(EE)模块的神经网络模型,其功能是将单词序列转换为许多身体量子系统的缠结纯状态。在单词序列内观察到强量子缠结,即量子信息的中心信息的中心概念和单词之间的并行相关相关性的指示。数值实验表明,与EE(QLM-EE)的提议的QLM与古典深神经网络模型和问题接听(QA)数据集的其他QLMS相比实现了卓越的性能。此外,可以通过量化词语之间的缠结程度来提高模型的后HOC可解释性。
translated by 谷歌翻译